1
Lo Spettro di Adattamento dei Modelli
AI030Lesson 5
00:00

Immagina un Modello Linguistico di Grandi Dimensioni (LLM) come un brillante ma generico studioso. Per trasformare questo studioso generico in un professionista specializzato β€” come un radiologo clinico o un avvocato contrattualista β€” dobbiamo muoverci lungo il Spettro di Adattamento dei Modelli. Questo spettro definisce come ci spostiamo dal prompting zero-shot alle modifiche neurali profonde, bilanciando i vincoli hardware con la richiesta di risultati allo stato dell'arte (SOTA) di punta.

Il Continuo di AdattamentoControllo e StabilitΓ  (in aumento β†’)Apprendimento In-ContestoPEFT / LoRAFine-tuning Completo

ModalitΓ  Chiave di Adattamento

  • Apprendimento In-Contesto (ICL): Il modello rimane "congelato". Apprende a stimare $P(y|x)$ osservando esempi direttamente all'interno del prompt stesso. Sebbene veloce, spesso soffre di alta varianza e allucinazioni.
  • Allineamento e StabilitΓ : Per raggiungere una affidabilitΓ  di livello produttivo, dobbiamo spostarci verso destra sullo spettro. Il fine-tuning offre un migliore allineamento con il giudizio umano penalizzando esplicitamente le deviazioni dai pattern veri.
  • L'Obiettivo SOTA: Raggiungere prestazioni di alto livello richiede un equilibrio tra compromessi. Il fine-tuning completo offre il massimo controllo ma comporta il rischio di "dimenticanza catastrofica", mentre PEFT (Fine-tuning Efficiente per Parametri) offre un punto di equilibrio amichevole nei confronti dell'hardware.
Esempio Reale
Considera un assistente medico. Usando ICL, fornisci tre esempi da sintomo a diagnosi nel prompt. Usando Fine-tuning, addestrerai il modello su 50.000 record medici. Quest'ultimo produce un modello che comprende naturalmente il linguaggio medico e mostra una stabilitΓ  e coerenza molto piΓΉ elevate Coerenza e StabilitΓ .